智能论文笔记

我们研究由线性卷积神经网络（LCN）代表的功能家族。这些函数形成了从输入空间到输出空间的线性地图集的半代数子集。相比之下，由完全连接的线性网络表示的函数家族形成代数集。我们观察到，LCN代表的功能可以通过接受某些因素化的多项式来识别，我们使用此视角来描述网络体系结构对所得功能空间几何形状的影响。我们进一步研究了在LCN上的目标函数的优化，分析了功能空间和参数空间中的临界点，并描述了梯度下降的动态不变性。总体而言，我们的理论预测，LCN的优化参数通常对应于跨层的重复过滤器，或可以分解为重复过滤器的过滤器。我们还进行了数值和符号实验，以说明我们的结果，并对小体系结构的景观进行深入分析。

translated by 谷歌翻译

A New Approach to Drifting Games, Based on Asymptotically Optimal Potentials

Zhilei Wang , Robert V. Kohn

分类：机器学习

2022-07-23

我们开发了一种新的方法来漂移游戏，一类两人游戏，其中包括许多应用程序来增强和在线学习设置，包括使用专家建议和对冲游戏的预测。我们的方法涉及（a）通过求解相关的部分微分方程（PDE）来猜测渐近的最佳潜力；然后（b）通过证明最终时间损失的上限和下限来证明猜测的合理性，它们的差异像个时间步数的负能力一样。我们潜在的基于上限的证据是基本的，只需使用泰勒的扩展。我们潜在的基于潜在的下限的证明也相当基本，将泰勒的扩展与概率或组合论证相结合。先前关于渐近最佳策略的大多数工作都使用了通过解决离散动态编程原理获得的潜力。这些论点因其离散性而变得复杂。我们使用的潜力是PDE的明确解决方案，这使我们的方法促进了我们的方法。这些论点基于基本的演算。我们的方法不仅更基本，而且还提供了新的电位，并得出相应的上和下限，这些上限和下限在渐近方面相互匹配。

translated by 谷歌翻译

这项工作介绍了两臂的伯努利强盗问题的版本，其中武器的平均值是一个（对称的两臂伯努利强盗）。在这些均值之间的差距为零的差距和预测期的次数接近无穷大的制度中，我们通过将它们与线性抛物线偏差的解决方案相关联，获得了预期的遗憾和伪造问题的领先顺序条款方程。我们的结果改善了先前已知的结果；具体而言，我们明确计算出最佳遗憾的主要顺序项和伪造的三种不同缩放制度。此外，我们在任何给定的时间范围内获得了新的非反应界限。

translated by 谷歌翻译